标签偏移:在机器学习/统计中,指类别标签的先验分布(各类比例)发生变化,但在给定标签时的特征分布保持不变(常写作 p(x|y) 不变,而 p(y) 改变)。它是“数据集偏移(dataset shift)”的一种常见类型。(在更宽泛语境中也可指“标签/标记发生变化”,但最常见用法在机器学习里。)
/ˈleɪbəl ʃɪft/
Label shift happens when the proportions of classes change.
当各个类别的比例发生变化时,就会出现标签偏移。
To handle label shift, the model’s predictions are often reweighted using estimated target class priors.
为应对标签偏移,通常会用估计得到的目标域类别先验对模型预测进行重新加权。
label 源自中古法语 label/lebel,本义与“挂在物品上的小纸条/标记”相关,后来引申为“名称、类别标签”。shift 源自古英语相关词根,核心含义是“移动、转变、变化”。合起来 label shift 字面即“标签发生转变”,在机器学习里特指“标签分布发生转变”。